智能论文笔记

本文介绍了一种用于合成包含连续，二进制和离散柱的表格数据集的双鉴别器GaN。我们所提出的方法采用适应的预处理方案和用于发电机网络的新型条件术语，以更有效地捕获输入样本分布。此外，我们为旨在向发电机提供更多辨别型梯度信息的鉴别器网络来实施直接但有效的架构。我们对四个基准测试公共数据集的实验结果证实了我们在可能性健身度量和机器学习效果方面的卓越性能。

translated by 谷歌翻译

Model-based graph reinforcement learning for inductive traffic signal control

François-Xavier Devailly , Denis Larocque , Laurent Charlin

分类：机器学习 | (统计)机器学习

2022-08-01

自适应交通 - 信号控制的大多数强化学习方法都需要从头开始培训，或在任何新的交叉点上或对道路网络，交通分布或培训期间经历的行为约束进行任何修改后。考虑到1）训练此类方法所需的大量经验，以及2）必须通过与真实的道路网络用户进行探索方式来收集经验，因此缺乏可转移性限制的实验和适用性。最近的方法使学习政策能够概括为看不见的道路网络拓扑和交通分布，从而部分应对这一挑战。但是，文献保持在循环的学习（十字路口的连通性的演变必须尊重周期）和无环（较少约束）策略之间的分配，而这些可转移的方法1）仅与循环约束兼容，2）不启用启用。协调。我们介绍了一种新的基于模型的方法Mujam，该方法首次启用了显式配位，该方法首次启用了显式协调，还通过允许对控制器的约束进行概括，进一步推动概括。在涉及道路网络和培训期间从未经历过的交通设置的零拍传输设置中，以及在曼哈顿控制3,971个交通信号控制器的更大转移实验中，我们表明，Mujam使用环状和无循环约束，均优于范围 - 特异性基准以及另一种可转移方法。

translated by 谷歌翻译

基于预测方法的深度学习已成为时间序列预测或预测的许多应用中的首选方法，通常通常优于其他方法。因此，在过去的几年中，这些方法现在在大规模的工业预测应用中无处不在，并且一直在预测竞赛（例如M4和M5）中排名最佳。这种实践上的成功进一步提高了学术兴趣，以理解和改善深厚的预测方法。在本文中，我们提供了该领域的介绍和概述：我们为深入预测的重要构建块提出了一定深度的深入预测；随后，我们使用这些构建块，调查了最近的深度预测文献的广度。

translated by 谷歌翻译